
Page 52 sur 69
Nous cherchons à repérer les individus partis dans notre population. De ce fait, nous nous
intéressons aux TP (True Positives) qui sont les individus partis et reconnus ‘partis’ par nos
modèles. Mais nous nous intéressons également aux FN (False Negatives) qui sont les
individus partis mais n’ont pas été reconnus comme tels par les modèles.
Nous allons donc essayer d’optimiser l’accuracy de nos modèles (pourcentage de prédictions
correctes) mais également le recall (pourcentage des individus réellement partis repérés par
le modèle).
Le calcul de l’ROC-AUC va également avoir un intérêt. En effet, il nous aidera à juger de la
performance de notre modèle puisqu’il mesure la capacité d'un modèle à discriminer les
classes dans le cas d’une classification binaire. Une AUC de 1 indique une séparation parfaite
entre les classes, tandis qu'une AUC de 0.5 signifie que le modèle ne fait pas mieux qu'un
tirage aléatoire.
Les variables prédictives du modèle seront (43):
‘cat__BusinessTravel_Travel_Frequently',
'cat__BusinessTravel_Travel_Rarely',
'cat__Department_Research &
Development',
'cat__Department_Sales',
'cat__EducationField_Life Sciences',
'cat__EducationField_Marketing',
'cat__EducationField_Medical',
'cat__EducationField_Other',
'cat__EducationField_Technical Degree',
'cat__EnvironmentSatisfaction_2_Moyen',
'cat__EnvironmentSatisfaction_3_Elevée',
'cat__EnvironmentSatisfaction_4_Très
élevée',
'cat__JobInvolvement_2_Moyen',
'cat__JobInvolvement_3_Elevée',
'cat__JobInvolvement_4_Très élevée',
'cat__JobLevel_2_Junior',
'cat__JobLevel_3_Confirmé',
'cat__JobLevel_4_Senior',
'cat__JobLevel_5_Expert',
'cat__JobSatisfaction_2_Moyen',
'cat__JobSatisfaction_3_Elevée',
'cat__JobSatisfaction_4_Très élevée',
'cat__JobRole_HumanResources_Job',
'cat__JobRole_Laboratory Technician',
'cat__JobRole_Manager',
'cat__JobRole_Manufacturing Director',
'cat__JobRole_Research Director',
'cat__JobRole_Research Scientist',
'cat__JobRole_Sales Executive',
'cat__JobRole_Sales Representative',
'cat__OverTime_OverTime-Yes',
'cat__WorkLifeBalance_2_Bon',
'cat__WorkLifeBalance_3_Très bon',
'cat__WorkLifeBalance_5_Parfait',
'num__Age',
'num__DistanceFromHome',
'num__MonthlyIncome',
'num__StockOptionLevel',
'num__TotalWorkingYears',
'num__TrainingTimesLastYear',
'num__YearsAtCompany',
'num__YearsInCurrentRole',
'num__YearsWithCurrManager'